Can AI Match Human Experts? Evaluating LLM-Generated Feedback on Resident Scholarly Projects
Questo studio dimostra che un modello linguistico su larga scala, se opportunamente istruito, può generare feedback formativi per progetti di ricerca dei residenti che, pur risultando generalmente inferiori a quelli degli esperti umani, in alcuni contesti specifici e nelle valutazioni di sicurezza raggiungono o superano la qualità umana.